查看原文
其他

图片上面写文字 - AnyText

renee创业狗 Renee 创业随笔
2024-10-10

今天体验了一个阿里的开源项目AnyText,感觉非常有趣。可以实现文本生成和文本编辑功能。

效果

以下是我运行后的效果展示:

特点

  • 支持各种角度

  • 支持各种语言

技术

AnyText 由一个扩散管道组成,主要包含两个部分:辅助潜在模块和文本嵌入模块。前者利用文本字形、位置和遮罩图像等输入生成用于文本生成或编辑的潜在特征。后者使用OCR模型将笔画数据编码为嵌入,与tokenizer生成的图像标题嵌入融合,从而生成与背景无缝融合的文本。AnyText采用了文本控制扩散损失和文本感知损失进行训练,以进一步提升书写的准确性。

对比

不同技术方案的效果对比如下:

继续滑动看下一个
Renee 创业随笔
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存